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Wstęp 


Od kilkudziesięciu lat dużą rolę w badaniach prowadzonych w ramach 
nauk humanistycznych pełnią korpusy językowe: zbiory uporządkowanych 
danych języka mówionego i pisanego, magazynowane i udostępniane w formie 
elektronicznej, zadaniem których jest odzwierciedlenie określonego języka 
(Lewandowska-Tomaszczyk, 2005a; Waliński, 2005). Zwraca się uwagę, iż korpus 
nie jest „lustrzanym odbiciem” tekstowej rzeczywistości języka (Chlebda, 2013, 
s.9) i że zarówno samo przeprowadzanie badań korpusowych, jak i opraco- 
wywanie uzyskanych danych jest i musi być uzupełniane wiedzą językową 
i intuicją zarówno badacza, jak i, często, tzw. naiwnych użytkowników języka. 
Uznaje się zatem konieczność „dywersyfikacji źródeł oraz stosowania zasady 
komplementarności”, w tym uzupełniania analiz przez dane introspekcyjne 
(Kiklewicz, 2018, s. 94). 
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W ostatnich dziesięcioleciach nasiliło się wykorzystywanie korpusów 
do badań z pogranicza językoznawstwa i nauk społecznych. Wiele z tych 
badań kwalifikuje się jako analizy socjolingwistyczne. W przeglądowych 
pracach Bakera na temat stosowania badań korpusowych w socjolingwistyce 
(Baker, 2006, 2010) kładzie się nacisk na rolę analiz kolokacji i konkordancji. 
Pozwalają one m.in. na określenie tzw. preferencji semantycznej i prozodii 
semantycznej. Określanie preferencji semantycznej badanej jednostki lek- 
sykalnej polega na sprawdzaniu, z wyrazami o jakim (wspólnym) znaczeniu 
jednostka ta często łączy się w tekstach korpusu, czyli inaczej na odkrywaniu 
tendencji współwystępowania jednostki z elementami określonej kategorii 
semantycznej (Baker, 2006, 2010; Stubbs, 2001). Natomiast prozodia seman- 
tyczna wyznacza nacechowanie (pozytywne lub negatywne) badanej jednostki, 
określone przez znaczenie współwystępujących z nią innych wyrazów, czyli 
wyraźniej (niż sama preferencja) wskazuje postawy autorów analizowanych 
wypowiedzi (Baker, 2006, 2010; Lewandowska-Tomaszczyk, 2005b). I tak 
np. Baker odtworzył w wyniku analizy kolokacji i konkordancji wyrazu spinster 
(stara panna) dwie negatywne prozodie: jedną związaną z brakiem zaspoko- 
jenia potrzeb seksualnych (np. wyrazy: sfrustrowana, głodna miłości i seksu, 
samotna), drugą — z brakiem atrakcyjności (np. wyrazy: okropna, zwyczajna, 
wysuszona, przesadnie wymalowana itp.) (Baker, 2006). Natomiast Mautner, 
analizując kolokaty słowa elderly (stary /'starszy / senior'), wykrył prozodię 
związaną ze słabym zdrowiem i niepełnosprawnością (wskazaną np. przez 
wyrazy słaby, chory, ofiara, pomoc itd.) (Mautner, 2007). 

Przedstawione wyżej przykłady ukazują możliwość traktowania analiz 
korpusowych jako istotnego narzędzia badania stereotypów, rozumianych 
jako nadmiernie uogólnione i uproszczone obrazy o wyraźnie zaznaczonym 
aspekcie oceniająco-afektywnym, dotyczące jakiegoś elementu rzeczywistości, 
na przykład grupy ludzi wyodrębnionej według kryterium typu płeć, wiek, 
narodowość, dysfunkcja itp. W bogatej literaturze na temat stereotypów 
podkreśla się od dawna, że są one nabywane, utrwalane i rozpowszechniane 
przy znaczącym udziale języka i komunikacji, że język ułatwia kategoryzację 
rzeczywistości, a także jest środkiem i narzędziem utrwalania i przekazywa- 
nia tej kategoryzacji (por. np. Chlewiński, 1992; Greń, 2001; Stangor X Schal- 
ler, 1999). Rozpowszechnianie stereotypów w ustnych i pisemnych aktach 
komunikacji nie musi być intencjonalne - może być efektem określonych cech 
uzusu językowego, np. częstego używania określonych form czy typowych 
kontekstów użycia (np. Maass 8: Arcuri, 1999; Mills, 2008). Poglądy takie stały 
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się podstawą stosowania, od pierwszej połowy XX wieku, licznych werbalnych 
metod rekonstruowania stereotypów. Większość z nich polega na pozyskiwaniu 
określonych reakcji werbalnych, ustnych lub pisemnych, od użytkowników 
danej społeczności językowej w przygotowanej sytuacji badawczej”. 

W dobie powstających coraz liczniej korpusów nasuwa się pytanie o sens 
kontynuowania badań nad stereotypami z użyciem takich klasycznych metod, 
skoro istnieje możliwość badań opartych na analizie zasobów korpusowych, 
stanowiących źródło bardzo bogatych i (wyjściowo) obiektywnych danych. 
Z pytaniem tym łączy się przekonanie o konieczności oszacowania przydat- 
ności informacji otrzymywanych przy zastosowaniu metod klasycznych do 
uzupełniania danych pozyskanych z korpusu. Próbę takiego oszacowania 
stanowią analizy zawarte w następnych częściach niniejszego artykułu. 

W nielicznych prowadzonych w XXI wieku badaniach porównawczych 
uzyskiwano zróżnicowaną zbieżność rezultatów testu skojarzeniowego z danymi 
korpusowymi. Na przykład Schulte im Walde i in. (Schulte im Walde i in., 2008) 
porównywali skojarzenia uzyskane od użytkowników języka niemieckiego 
z korpusem 20 milionów wyrazów z czasopism i stwierdzili, że ponad 3/4 reakcji 
na hasła czasownikowe i ponad 80% na rzeczownikowe współwystępowało 
z hasłem przynajmniej jeden raz w materiałach korpusu, w odległości <20 wyra- 
zów. Mollin porównywała skojarzenia z Edinburgh Associative Thesaurus dla 
30 wybranych losowo haseł ze zbiorem kolokatów dla tych haseł znalezionych 
w British National Corpus w odległości <4 wyrazów (Mollin, 2009). Ponad 
50% par hasło-skojarzenie znalazło się w zbiorze hasło-kolokat z korpusu”. 


Podstawa badania: wybór hasła, korpusu i testu 


Hasło: Do analizy wybrano słowo inwalida. Prawie do końca XX wieku istotą 
„inwalidztwa” w rozumieniu ustawowym była niezdolność do wykonywania pracy, 
stanowiąca następstwo długotrwałej albo stałej wady czy defektu fizycznego lub 
umysłowego (Więckowska, 2004) i w taki właśnie sposób — poprzez niezdolność do 





' Przeglądy i przykłady różnych badań i metod w polskiej literaturze na temat stereo- 
typów można znaleźć np. w pracach: Bartmiński 8: Panasiuk, 2010; Karwatowska $ Szpyra- 
-Kozłowska, 2005. 

+ W obliczeniach brano pod uwagę jedynie kolokaty, które współwystępowały z hasłem 
w korpusie więcej niż 5 razy (Mollin, 2009). 
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pracy — najczęściej definiowano i nadal często się definiuje wyraz inwalida w słow- 
nikach (por. np. SWO, 1980; SJPDun, 1996; internetowy Słownik PWN - PWN, 
b.d. — lub definicja na stronie https://slownik.rownosc.info/ pod hasłem „niepełno- 
sprawność”: Peretiatkowicz-Czyż 8: Todys, 2015). Współcześnie pojawiają się także 
definicje, które nie nawiązują bezpośrednio do wykonywania pracy, natomiast suge- 
rują synonimię między słowami inwalida a niepełnosprawny. Ten drugi termin jest 
zdecydowanie częściej stosowany we współczesnej literaturze psycho- i socjologicznej 
i traktowany jako bardziej poprawny w dyskursie integracji, bo mniej obciążony 
negatywnymi konotacjami. Właśnie m.in. wyrazistość afektywno-emocjonalna 
terminu inwalida stała się podstawą jego wyboru do badania, zwiększa ona bowiem 
prawdopodobieństwo kształtowania się takiego obrazu, który będzie miał cechy 
stereotypu. W myślenie o osobach niepełnosprawnych, inwalidach itp. włącza się 
często element lęku i niepewności, lęku związanego z własnym funkcjonowaniem 
osoby pełnosprawnej, z uświadomieniem sobie nietrwałości zdrowia i płynącego 
stąd niebezpieczeństwa utraty samodzielności, a nawet realności śmierci (Barnes 
X Mercer, 2008; Biernat 8 Dovidio, 2008; Ostrowska, 2002). Cechy te mogą się 
wyraźnie ujawniać we wszystkich klasycznych technikach badania stereotypów, 
stąd ich porównanie z danymi korpusowymi wydaje się bardzo interesujące. 

Korpus: Analizy przeprowadzono, korzystając z Narodowego Korpusu 
Języka Polskiego (NKJP, b.d.), uruchomionego w 2012 roku, a dokładniej 
z tzw. zrównoważonego podkorpusu NKJP, liczącego 300 milionów segmen- 
tów (czyli około 250 milionów słów”). Przy opracowywaniu NKJP przyjęto, iż 
w podkorpusie zrównoważonym żaden z typów tekstów nie obejmuje więcej 
niż połowę zasobów, stąd najsilniej reprezentowane teksty prasowe stanowią 
50% podkorpusu (Górski 8 Łaziński, 2012). 

Test: Do analiz wybrano test skojarzeń swobodnych, czyli technikę badawczą, 
która polega na prezentacji słowa-hasła wraz z instrukcją zalecającą badanym podanie 
dowolnego innego wyrazu lub wyrazów w odpowiedzi na usłyszane lub przeczytane 
hasło. Jest to metoda o ponad stuletniej już tradycji i szerokim zasięgu stosowania”. 





* Jako segmenty w NKJP traktowano ciągi znaków nie dłuższe niż słowa (rozumiane jako 
maksymalne ciągi znaków nie będących separatorami słów), a w niektórych, ściśle określo- 
nych przypadkach ciągi krótsze niż słowa (dokładna charakterystyka sposobu wyodrębniania 
i liczenia segmentów por. Szałkiewicz 8: Przepiórkowski, 2012). 

*. Przegląd informacji na temat mechanizmu skojarzeniowego, typów testu i ich zastoso- 
wań dawniejszych i współczesnych można znaleźć m.in. w pracach: Deese, 1965; Kurcz, 1976; 
Mikołajczak-Matyja, 2012. 
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Zaletą stosowania tego testu do badań nad stereotypami jest możliwość uzyskania 
szerokiego spektrum danych — nie tylko o charakterze afektywno-ewaluacyjnym, 
ale także innych, w różnorodny sposób powiązanych z denotatem hasła. Poszukiwa- 
nie takich danych w potencjalnie bardzo szerokim zakresie kontekstów zawartych 
w korpusie wydaje się tym bardziej interesujące. Można założyć, że skojarzenia 
silne, a jednocześnie często współwystępujące z hasłem w materiale korpusowym 
stanowią źródło informacji szczególnie istotnych dla badanego stereotypu, a nawet 
że są one kluczowymi, definicyjnymi elementami znaczenia badanego wyrazu. 

Pochodzenie materiału skojarzeniowego: Do analiz, ze względu na 
datowanie źródeł zawartych w NKJP (przed 2012 rokiem), zdecydowano się 
wykorzystać dane skojarzeniowe pozyskane w badaniach własnych z 2011 roku. 
40 uczniów i uczennic polskich liceów ogólnokształcących, w wieku 15-18 lat, 
otrzymało następującą instrukcję: „Wypisz dowolną liczbę słów, które przy- 
chodzą Ci na myśl w związku z poniższym hasłem. Masz na to 2 minuty. Nie 
zastanawiaj się nad odpowiedzią i wyborem wyrazów”. Uzyskano w sumie 
323 reakcje. Połączenie reakcji identycznych podanych przez różnych badanych 
stanowiło podstawę wyznaczenia wskaźnika liczby różnych reakcji; wyniósł 
on 192. Postanowiono poszukiwać w materiałach korpusowych jedynie sko- 
jarzeń istotniejszych, czyli powtarzalnych, nieindywidualnych, tj. podanych 
przez min. 2 osoby. Stanowią one zbiór 33 reakcji, przedstawionych (wraz 
z częstością ich podawania przez badanych) w tabeli 1 (zob. s. 8). 


Analiza: poszukiwanie danych 
skojarzeniowych w korpusie 


Punktem wyjścia analiz przedstawianych w tej pracy były dane skojarzeniowe: 
sprawdzenie, czy i jak często wyraz inwalida współwystępuje z nimi w zasobach kor- 
pusowych'. Sprawdzono współwystępowanie słowa inwalida kolejno z każdym z 33 
skojarzeń, z użyciem narzędzia szukającego kontekstów (konkordancji) zawierających 
oba wyrazy — inwalida i skojarzenie — w zadanym odstępie. Do badania konkordancji 
w NKJP wykorzystano wyszukiwarkę PELCRA. W okienku wyszukiwarki wprowa- 





* Przeprowadzono także badanie, w którym punktem wyjścia były dane z NKJP uzyskane 
przez zastosowanie narzędzia Kolokator, porównane następnie bardzo szczegółowo z wynikami 
testu skojarzeniowego. Stanowi ono przedmiot odrębnej pracy (Mikołajczak-Matyja, 2020), 
por. także „Podsumowanie i wnioski” w niniejszym artykule. 
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dzano zapisy „inwalida**___X**” (X - podstawowa forma gramatyczna skojarzenia), 
w których znak „**” powoduje wyszukiwanie wszystkich wariantów fleksyjnych danego 
wyrazu, a znak „___* (potrójny podkreślnik) — wyszukiwanie współwystępowania 
wyrazu po jednej jego stronie z wyrazami po drugiej (według instrukcji w: Pęzik, 2012). 
Zdecydowano się przeprowadzić porównanie dla 2 wariantów odstępu: 0 15, czyli dla 
występowania wyrazu inwalida i skojarzenia w bezpośrednim sąsiedztwie i w odstę- 
pie maksimum 5 wyrazów. Można zatem zakładać, że w znalezionych kontekstach 
badana para wyrazów najczęściej będzie należeć do tego samego zdania prostego, do 
składowych zdań tego samego zdania złożonego lub do zdań sąsiadujących ze sobą. 
Wprowadzenie do analiz większego odstępu (<5) wydaje się wskazane ze względu na 
rzeczownikowy charakter uzyskanego zbioru skojarzeń”, potencjalnie utrudniający 
współwystępowanie niektórych asocjacji z rzeczownikiem inwalida w bezpośrednim 
sąsiedztwie. W formułowaniu zadania dla wyszukiwarki nie wskazano konieczności 
zachowania szyku „najpierw inwalida, potem X”. Jak wspomniano wyżej, zadawano 
wyszukiwanie w podkorpusie zrównoważonym. Jednakże w kilku przypadkach 
(por. niżej) uzupełniono badanie, zadając wyszukiwanie w całym korpusie. 

Do analiz wykorzystano wszystkie konkordancje znalezione przez narzędzie, 
z wyjątkiem tych, w których wyraz inwalida stanowi część nazwy geograficznej 
(np. Plac Inwalidów), oraz tych, których kontekst wskazuje na znaczenie wyrazu- 
-asocjacji prawdopodobnie niewykorzystane przez badanego podającego taką reak- 
cję. To drugie ograniczenie wymaga wyjaśnienia. Interpretacja wyników badania 
skojarzeniowego, czyli odtwarzanie prawdopodobnej ścieżki skojarzeniowej między 
bodźcem a reakcją, opiera się na specyfice języka stanowiącego przedmiot badania 
oraz na wiedzy i intuicji badacza (wspartej źródłami na temat języka). Zakładamy 
np., że reakcja kula na hasło inwalida dotyczy najprawdopodobniej kuli w znaczeniu 
„podpórki dla osoby niepełnosprawnej” (por. np. definicja w ISJP, 2014, t. 1, s. 729), 
zatem znaleziony w korpusie kontekst typu został inwalidą za sprawą policyjnej kuli 
można wyłączyć z analiz. Założenie takie, mimo iż nie musi być zawsze stuprocentowo 
słuszne (bo nie znamy osobistych doświadczeń i całości wiedzy danego respondenta), 
wydaje się jednak sensownie ograniczać analizę uzyskanego materiału. Na podobnej 
zasadzie wyłączono z obliczeń konteksty, w których skojarzenie wózek odnosi się 








* Wyjątkiem są skojarzenia, które mogą w odpowiednich kontekstach stanowić rzeczownik 
lub przymiotnik albo imiesłów: niepełnosprawny, chory, niewidomy, poszkodowany. Zgodność 
kategorii gramatycznej między bodźcem a reakcją cechuje zazwyczaj znaczącą większość 
odpowiedzi uzyskiwanych w badaniach skojarzeniowych; jest to cecha odzwierciedlająca 
budowę słownika umysłowego (por. np. Łobacz 8: Mikołajczak-Matyja, 2002; Mollin, 2009). 
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do wózka dziecięcego (np. krawężniki to kłopot dla matek z wózkami, rowerzystów 
i inwalidów). Z obliczeń wykluczono także przypadki użycia wyrazów w znaczeniach 
metaforycznych i/lub stanowiących część utartych powiedzeń czy frazeologizmów 
(np. noga: rzucanie kłód pod nogi spółdzielniom inwalidów). Pozostałe konteksty użycia 
wyrazów-asocjacji uwzględniano w obliczeniach, zakładając ich możliwą zbieżność 
ze ścieżką skojarzeniową, która spowodowała pojawienie się danej reakcji podczas 
badania. Na przykład wystąpienie reakcji rodzina może wynikać z aktywizowania 
bardzo różnych doświadczeń i opinii: że inwalida często nie ma rodziny, że jego 
rodzina ma kłopoty większe niż inna itd. U podstaw reakcji problem mogą występo- 
wać opinie, że inwalida ma problem bądź że jest przyczyną określonych problemów, 
a u podstaw reakcji niepełnosprawny — opinia zarówno, że inwalida to inna nazwa 
niepełnosprawnego, jak i że jest to określenie podtypu osoby niepełnosprawnej. 

W przypadku dwóch skojarzeń (w tabeli oznaczonych gwiazdką) forma 
wpisana w wyszukiwarkę była odmienna niż ta podana przez badanych: 
wpisanie w okienko formy udogodnienie/a oraz pokrzywdzony nie uruchamia 
wyszukiwania (powoduje brak odpowiedzi”), dlatego zastąpiono je bezoko- 
licznikami udogodnić i pokrzywdzić; znalezione konteksty są zgodne z formą 
skojarzenia, czyli, odpowiednio, rzeczownika odsłownego i imiesłowu. 

Liczby uzyskanych kontekstów dla odstępu 0 i <5 przedstawiono w tabeli 1 
(odpowiednio: O 0105)”. L - liczba osób (N = 40) podających dane skojarzenie. 
Reakcje w tabeli uporządkowane są wg ich siły skojarzeniowej (od 28 do 2). 


Wyniki dla odstępu 0 


Dla reakcji o najsilniejszym współwystępowaniu w materiałach NKJP 
wartości testu chi kwadrat, wskazujące stopień istotności współwystą- 
pień”, wynoszą odpowiednio (w nawiasach liczba współwystąpień, dalej 
wartość testu): niepełnosprawny (12) 1,440.34, chory (11) 419.86, poszkodo- 





7 W przeciwieństwie do odpowiedzi „znaleziono 0 akapitów pasujących do zapytania”, 
która stanowiłaby efekt uruchomienia wyszukiwania. 

* Są to liczby przykładów dostarczanych przez wyszukiwarkę (zmniejszone o te odrzu- 
cane po analizie według podanych wyżej zasad), a nie podawane przez nią liczby akapitów. 

* Test wskazuje, w jakim stopniu liczba współwystąpień dwóch wyrazów wynika z ogólnej 
częstości występowania tych wyrazów w korpusie oddzielnie: im wyższa wartość testu, tym 
niższe prawdopodobieństwo, że liczba współwystąpień wynika tylko i wyłącznie z częstości 
występowania wyrazów oddzielnie (Pęzik, 2012). 
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wany (9) 1,871.33, kaleka (7) 7,384.53, rehabilitacja (7) 928.23, wózek (6) 770.75, 
pomoc (6) 26.84, problem (5) 10.45*. Najwyższą siłę połączenia z wyrazem 
inwalida w tekstach NKJP mają zatem skojarzenia: niepełnosprawny (w licz- 
bach bezwzględnych) i kaleka (według wartości testu chi kwadrat). Drugie 
pod względem częstości bezwzględnej skojarzenie chory ma stosunkowo 
niską wartość testu chi kwadrat. 


Tabela 1. Liczba skojarzeń i liczba ich współwystąpień z wyrazem inwalida 



























































w odstępie 0 i <5 
Reakcje skojarzeniowe jaa Reakcje skojarzeniowe UE 

Reakcja L O0 O5 Reakcja L O0 | O5 
wózek (inwalidzki) 28 6 82 | proteza/y 3 0 8 
niepełnosprawny 16 12 90 | człowiek/ludzie 2 3 67 
kula/e 12 1 13 | złamanie/a 2 0 0 
choroba 8 0 13 | niedołężność 2 0 0 
wypadek 8 2 36 | niewidomy 2 3 18 
szpital 7 1 12 | noga/fi 2 1 30 
niepełnosprawność 7 0 10 | cierpienie 2 0 1 
pomoc 7 6 43 | miłość 2 0 1 
kaleka 6 7 13 | szacunek 2 0 0 
kalectwo 5 0 4 | poszkodowany 2 9 33 
chory 5 11 63 | rodzina 2 2 |126 
trudność/ci 5 1 2 | udogodnienia* 2 1 6 
tolerancja 4 0 0 | akceptacja 2 0 1 
rehabilitacja 4 7 43 | pokrzywdzony* 2 0 1 
problem/y 4 5 26 | nieostrożność 2 0 0 
smutek 3 0 0 | ograniczenia 2 1 10 
winda 3 0 4 





























15 spośród 33 skojarzeń w ogóle nie występuje w bezpośrednim sąsiedztwie 
wyrazu inwalida w kontekstach znalezionych w podkorpusie zrównoważonym 
NKJP, z czego 11 to skojarzenia o najniższych częstościach (8 o częstości =2, czyli 





"Wartości wyliczone z użyciem narzędzia Kolokator wyszukiwarki PELCRA. Wyniki 
testu podano w takiej formie, w jakiej podawane są one przez NK]P: tysiące od jednostek 
oddziela przecinek, liczby całkowite od ułamków - kropka. 
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L2*, a 3 o częstości L3). Natomiast tylko 1 kontekst bezpośredni znaleziono dla 
kolejnych 6 skojarzeń, w tym dla 3 również o najniższej częstości (czyli L2). Mimo 
różnic w rangach poszczególnych elementów między zbiorami skojarzeń i kon- 
tekstów widoczne są zatem również pewne zbieżności. Do największych różnic 
między dwoma uporządkowaniami należy: z jednej strony stosunkowo wysoka 
liczba kontekstów (9) i wysoka wartość chi kwadrat (druga co do wielkości w tym 
zbiorze) dla słowa poszkodowany, reakcji o najniższej częstości skojarzeniowej 
(L2) oraz bardzo wysoka (najwyższa w zbiorze) wartość testu chi kwadrat dla 
skojarzenia kaleka o częstości L6 (dopiero szósta co do częstości reakcja w zbiorze 
skojarzeń), a z drugiej strony — brak kontekstów dla słów choroba, niepełnosprawność 
i kalectwo, wskazanych w teście skojarzeniowym odpowiednio przez 20%, 17,5% 
i 12,5% grupy respondentów. Ta druga rozbieżność spowodowana jest rzeczowni- 
kowym charakterem tych trzech reakcji (utrudniającym gramatycznie poprawne 
bezpośrednie połączenia z wyrazem inwalida), o czym świadczą najwyższe liczby 
(12 i 11) połączeń tego wyrazu z formami rzeczownikowo-przymiotnikowymi 
niepełnosprawny i chory. Główną właściwością zbioru kontekstów bezpośrednich 
dla wyrazu inwalida w odniesieniu do zbioru skojarzeń wydaje się brak połączeń 
ze skojarzeniami o charakterze rzeczowników abstrakcyjnych, oznaczających 
cechy i uczucia: oprócz trzech już wymienionych są to także nieostrożność i nie- 
dołężność, a także cechy oznaczające stosunek do innych: tolerancja, szacunek, 
akceptacja, oraz nazwy uczuć: smutek, cierpienie, miłość. 


Wyniki dla odstępu <5 


Liczby zawarte w kolumnie „O 5” wskazują, że ze słowem inwalida najczęściej 
współwystępują, w odległości maksimum 5 wyrazów, niniejsze elementy zbioru 
skojarzeń (uszeregowano je tu od najwyższej liczby kontekstów znalezionych przez 
narzędzie do najniższej, wynoszącej 30): rodzina, niepełnosprawny, wózek, człowiek, 
chory, rehabilitacja, pomoc, wypadek, poszkodowany, noga. Widoczne jest zatem, iż 
najczęstsze skojarzenia na hasło inwalida — wózek i niepełnosprawny — to wyrazy 
prawie najczęściej z całego zbioru występujące w kontekstach (o randze odpowied- 
nio III i II). Można je zatem uznać za istotne elementy znaczenia słowa inwalida. 





u W celu uniknięcia niejednoznaczności z literą L (Liczba osób) będą podawane częstości 
uzyskane w badaniu skojarzeniowym, a częstości wystąpień w korpusie będą przytaczane bez 
takiego oznaczenia, a jedynie liczbowo. 
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Widoczna jest natomiast wyraźna różnica w danych uzyskanych dla skoja- 
rzenia rodzina: najniższa częstość wystąpień wśród skojarzeń (L2), a najwyższa 
wśród kontekstów (ranga I — aż 126 wystąpień). Na ten liczny zbiór składają się 
jednak głównie cytaty z obrad Sejmu oraz z „Gazety Ubezpieczeniowej , dotyczące 
inwalidów wojennych i wojskowych oraz ich rodzin, a dokładniej ich przywilejów/ 
uprawnień, a zwłaszcza ustaw/przepisów o ich zaopatrzeniu. Stosunkowo duży 
zbiór współwystępowań wyrazów inwalida i człowiek (67 — ranga IV - a przy 
tym najniższa siła skojarzeń L2) jest bardziej urozmaicony, ale daje się w nim 
wyodrębnić dwie wiodące tendencje: są to teksty kwalifikujące człowieka jako 
inwalidę (człowiek jest/zostaje inwalidą — wyraz inwalida pełni tu zatem funk- 
cję orzecznika) lub wymieniające inwalidów razem z innymi grupami osób 
specjalnej troski, np. ludzi chorych czy starszych. Podobnie jest w przypadku 
równie słabego skojarzenia (L2) poszkodowany, także o stosunkowo wysokiej 
częstości współwystępowań (33 — ranga VIII): znaczącą część zbioru kontek- 
stów stanowią fragmenty z „Gazety Ubezpieczeniowej”, w tym kolokacje typu: 
poszkodowany inwalida, poszkodowany stał się | zostanie inwalidą. Natomiast 
zbiór kontekstów dla słabego skojarzenia noga (także L2) pochodzi z różnych 
źródeł, a najbardziej typowe jest tu połączenie inwalida bez nogi/nóg. Wyrazy 
o rangach V-VII - chory (63 konteksty), rehabilitacja i pomoc (po 43) oraz 
wypadek (36) — stanowią dość silne skojarzenia (o sile, odpowiednio, L5, L4, 
L7 i L8, a więc podane przez 10% do 20% grupy badanych). 

Zbiór 15 skojarzeń, które nie występowały w bezpośrednim sąsiedztwie wyrazu 
inwalida, przy zadanym odstępie <5 zmniejszył się do 6. Zwiększenie odstępu 
spowodowało pojawienie się kilkunastu współwystępowań inwalidy z rzeczowni- 
kami niepełnosprawność i choroba, kilku z kalectwem, a także z nazwami urządzeń 
typu proteza i winda. Tylko po 1 kontekście pojawiło się dla wyrazów akceptacja, 
pokrzywdzony, miłość i cierpienie. Natomiast żadnych kontekstów przy odległości 
maksimum 5 wyrazów nie znaleziono dla skojarzeń: tolerancja, smutek, złamanie, 
niedołężność, szacunek, nieostrożność. Wydaje się zatem, że zwiększenie zbioru 
współwystępowań do odległości maksimum 5 wyrazów potwierdza niewielką 
możliwość znalezienia nazw cech i uczuć w powiązaniu z inwalidą za sprawą badań 
korpusowych. 

Aby upewnić się co do tego wniosku, rozszerzono wyszukiwanie dotyczące 
tych 6 wyrazów, dla których nie uzyskano ani jednego wspólnego kontekstu. 
Po pierwsze zadano wyszukanie współwystępowań dla pokrewnych form 
przymiotnikowych i czasownikowych, czyli: tolerować, tolerancyjny, smutny, 
złamać, niedołężny, szanować i nieostrożny (dla odstępu <5, w korpusie zrów- 
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noważonym). Dla 4 z tych 7 form znaleziono konteksty: szanować (3, z czego 
2 zawierają połączenie szanować prawa, np. Tak właśnie szanowane są prawa 
inwalidów), złamać (2), smutny (1), niedołężny (1). Po drugie zadano wyszuki- 
wanie 6 skojarzeń w ich pierwotnej formie dla odstępu <5 w całym korpusie 
(liczącym ponad 1,5 mld słów). Konteksty uzyskano tylko dla 3 z 6 wyrazów: 
szacunek (9'*), złamanie (2), tolerancja (1). 


Podsumowanie i wnioski 


Próba poszukiwania w korpusie kontekstów zawierających bodziec (inwa- 
lida) i (powtarzalną) reakcję skojarzeniową daje efekty pozytywne: większość 
asocjacji współwystępuje w danych korpusowych z wyrazem inwalida. Zna- 
leziono konteksty z bezpośrednim sąsiedztwem bodźca i reakcji (odstęp 0) 
dla większości, bo 18 ze zbioru 33 skojarzeń, a przy zwiększeniu odstępu 
do maksimum 5 liczba ta zwiększa się do 27 (ponad 80% zbioru skojarzeń). 
Ponadto znaczna większość skojarzeń (11 z 15), które nie występują w danych 
korpusowych w bezpośrednim sąsiedztwie wyrazu inwalida, to reakcje o naj- 
niższych częstościach (L2 i L3). Przynależność bodźca i reakcji do tej samej 
kategorii gramatycznej, ograniczająca możliwość występowania niektórych 
takich wyrazów w bezpośrednim kontekście, przestaje być przeszkodą przy 
zwiększeniu odstępu do maksimum 5 wyrazów. 

Przy odstępie <5 wyraźnie uwypuklają się zbieżności między wynikami testu 
skojarzeń a efektem przeszukiwania korpusu, polegające na dużej sile - w obu 
zbiorach danych — kilku wyrazów: przede wszystkim wózek i niepełnosprawny, ale 
także chory, rehabilitacja, pomoc i wypadek. Siła tych pierwszych dwóch reakcji 
tak w danych korpusowych, jak i w skojarzeniach wskazuje, że inwalidztwo to 
ten rodzaj niepełnosprawności, którego prototypem jest człowiek na wózku (czyli 
inwalida narządu ruchu). Można zatem postulować włączanie tej informacji do 
leksykograficznych definicji wyrazu inwalida lub przynajmniej wykorzystywanie 
kontekstów zawierających wyrazy niepełnoprawność i wózek w ilustracji materia- 





12 Wyszukiwarka zwraca w tym przypadku w sumie 37 przykładów, z czego jednak 2 
dotyczą innego znaczenia wyrazu (szacunek finansowy, w znaczeniu przybliżonego określa- 
nia wartości), a 26 — to wielokrotnie powielone zestawienie tematów z internetowej grupy 
dyskusyjnej Usenet -- pl.soc.polityka, w którym znalazły się obok siebie: O równe prawa dla 
inwalidów w Unii Europejskiej O szacunek dla przeszłości... 
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łowej artykułu słownikowego”. Cztery pozostałe wymienione reakcje powinny 
natomiast, jak się wydaje, być uwzględniane we wszelkich bardziej szczegółowych 
rozważaniach semantycznych na temat jednostki leksykalnej inwalida (i w roz- 
ważaniach na temat inwalidztwa prowadzonych w ramach innych dziedzin). 

Przy odstępie <5 wyraźniej uwypuklają się także tendencje dotyczące różnic 
między częstością skojarzenia na słowo inwalida a częstością współwystępowania 
pary inwalida-skojarzenie w korpusie. Z jednej strony zbiór przykładów korpuso- 
wych wskazuje dużą siłę współwystępowania wyrazu inwalida z kilkoma słabymi 
skojarzeniami, takimi jak rodzina (zdecydowanie największy zbiór kontekstów) 
oraz człowiek/ludzie i noga/nogi. Jest to spowodowane głównie dużą liczbą tek- 
stów zawierających cytaty z różnych przepisów i ustaw prawnych na temat osób, 
które są / stają się inwalidami (w tym inwalidami bez nóg), i ich rodzin. Z dru- 
giej strony badania korpusowe dają mniejszą możliwość wydobycia skojarzeń 
o znaczeniu ewaluacyjno-emocjonalnym związanych z pojęciem inwalidy, co 
wyraża się w braku lub bardzo małej liczbie współwystępowań tego wyrazu ze 
skojarzeniami-nazwami cech i uczuć, przy zadanym odstępie zarówno 0, jaki 5. 
Rozszerzenie badania wykazało, że jest to względnie niezależne od kategorii 
gramatycznej nazwy cechy czy uczucia i od wielkości przeszukiwanych zasobów. 
Negatywna prozodia semantyczna badanego wyrazu ujawniona w skojarzeniach 
nie znajduje pełnego odzwierciedlenia w danych korpusowych. 

W analizach badań skojarzeniowych powszechne jest stosowanie podziału 
na reakcje paradygmatyczne i syntagmatyczne (por. np. Kurcz, 1976; Łobacz 
$% Mikołajczak-Matyja, 2002; Mollin, 2009). Reakcja syntagmatyczna jest inter- 
pretowana jako dalszy ciąg frazy, której część stanowi bodziec (pies-szczeka), 
a w przypadku skojarzeń paradygmatycznych hasło i reakcja mogą stanowić ten 
sam możliwy fragment danej wypowiedzi (pies-kot)'* (Mikołajczak-Matyja, 2012, 
s. 108). Korpus stanowi próbkę wyników produkcji języka, a więc próbkę kom- 
binacji słów. Zatem jednym z wyjaśnień niskiej korelacji między danymi skoja- 
rzeniowymi a korpusowymi jest fakt podawania przez badanych wielu reakcji 





13 Konieczne jest tu zastrzeżenie, że konteksty współwystępowania wyrazów inwalida i nie- 
pełnosprawny nie zawsze wskazują relację podrzędności między nimi; w niektórych przykładach 
wyszukanych przez narzędzie wyrazy te traktowane są inaczej, np. synonimicznie. Szczegółowa 
analiza zbioru kontekstów i próba procentowego określenia rodzajów relacji może być przedmiotem 
odrębnej pracy, która jednak powinna uwzględniać także zmiany diachroniczne. 

'4 Tj. wymiana jednego elementu na drugi nie zakłóca poprawności gramatycznej 
i sensowności tekstu. 
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paradygmatycznych, powiązanych z bodźcem określoną relacją semantyczną 
(jak synonimia, antonimia, meronimia itp.) (Mollin, 2009). Jednakże paradyg- 
matyczny charakter reakcji nie wyklucza możliwości jej współwystępowania 
z bodźcem w materiale językowym (zwłaszcza przy odległości >0). Wszystkie 
analizowane tu asocjacje werbalne miały charakter rzeczownikowy lub rze- 
czownikowo-przymiotnikowy (jak chory). Wiele skojarzeń należących do tej 
samej kategorii gramatycznej co hasło może nie tylko współwystępować z nim 
w wypowiedziach, ale także wejść w silną relację syntagmatyczną z hasłem, por. 
inwalida-wózek: inwalida na wózku. Dotyczy to także par połączonych silną 
relacją semantyczną typu część-całość, np. inwalida-noga: inwalida bez nogi, 
inwalida-rodzina: rodziny inwalidów itp. 

W innych analizach, przedstawionych w pracy Wartość korpusów językowych 
jako materiału do badania stereotypów osób z niepełnosprawnością: porównanie 
wyników zastosowania narzędzia Kolokator ze zbiorem asocjacji słownych (Miko- 
łajczak-Matyja, 2020), punktem wyjścia były dane z NKJP pozyskane z użyciem 
narzędzia Kolokator i porównane następnie ze zbiorem skojarzeń swobodnych. 
Wyodrębniono m.in. grupę 50 bezpośrednich rzeczownikowych kolokatów 
wyrazu inwalida, które nie stanowią reakcji skojarzeniowych. Stwierdzono, 
że wyrazy z tej grupy należą głównie do następujących kręgów tematycznych: 
nazwy instytucji i związków, grupy inwalidztwa, utrzymanie i praca, środowisko, 
działania na rzecz inwalidów, wojna i jej skutki. Stwierdzono zatem, że przeszu- 
kiwanie danych korpusowych za pomocą Kolokatora jako punktu wyjścia daje 
w efekcie wiele informacji ważnych z perspektywy społecznej, takich jak: fakt 
zrzeszania się inwalidów w spółdzielniach i związkach, rola dzielenia inwalidów 
na grupy wg kryterium tak rodzaju inwalidztwa, jak i przyczyn (inwalidzi wojenni 
i wojskowi stanowią częsty temat w tekstach korpusu) czy sprawy związane z ich 
utrzymaniem. Takie społeczne i instytucjonalne dane nie są aktywizowane 
w odpowiedzi na hasło inwalida w teście skojarzeniowym. Z drugiej strony 
potwierdzono brak w wynikach Kolokatora nazw uczuć (np. smutek, cierpienie, 
miłość) czy wyrazów obrazujących bezpośrednio relacje z innymi (jak akceptacja, 
szacunek, tolerancja), a zatem słów, bez których prozodia semantyczna wyrazu 
inwalida wydaje się niepełna (Mikołajczak-Matyja, 2020). 

Podsumowując, można w charakterze wniosków postulować trzy główne funkcje 
danych otrzymywanych z testu skojarzeniowego, w świetle danych korpusowych: 


- wskazywanie elementów najważniejszych dla znaczenia badanego 
wyrazu — silnych reakcji skojarzeniowych na dany wyraz, jednocześnie 
często współwystępujących z tym wyrazem w tekstach, 
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- ukierunkowanie wyszukiwania konkordancji, 


- dostarczanie danych, których nie ma w zbiorach uzyskiwanych w wyniku 
przeszukiwania korpusu. 


Oczywiście zasięg formułowanych wniosków jest ograniczony przez dobór 
wyrazu stanowiącego punkt wyjścia badań, przez liczbę i rodzaj respon- 
dentów biorących udział w teście skojarzeń, typ testu, wreszcie przez cechy 
NKJP i zastosowane techniki badań korpusowych. Wydaje się jednak, że 
przeprowadzone analizy stanowią dowód na sensowność uzupełniania badań 
opartych na korpusach technikami klasycznymi (a więc uzupełniania badań 
prowadzonych na gotowym produkcie językowym takimi, które wskazują siłę 
powiązań w słowniku umysłowym) i odwrotnie, zwłaszcza gdy przedmiotem 
badań leksykalno-semantycznych są wyrazy, pod którymi kryją się pojęcia 
istotne dla życia społecznego i zagrożone stereotypizacją. 


Zastosowane skróty 


ISJP — Inny słownik języka polskiego (Bańko, 2014). 

NKJP  - Narodowy Korpus Języka Polskiego, 2019. 

SJPDun - Słownik współczesnego języka polskiego (Dunaj, 1996). 
SWO  - Słownik wyrazów obcych (Tokarski, 1980). 
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Verbal Associations in the National Corpus 
of Polish: A Contribution to the Study of 
the Verbal Stereotype of inwalida 'an invalid” 


Summary 


The role of corpus research in linguistics and in related fields of study has 
increased in recent decades. Searching for and analysis of collocations and 
concordances of a lexical unit, which makes it possible to determine its seman- 
tic preferences and semantic prosody, can be a tool for studying stereotypes, 
understood as overly generalized and simplified evaluative and affective images 
of a fragment of reality named by the lexical unit. The aim of this article is to 
verify the validity of supplementing studies based on the analysis of corpus 
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resources with data obtained in free association tests. The study focuses on 
the lexical unit inwalida 'an invalid" as the name of a concept which may be 
subject to strong stereotyping. The resources of the balanced sub-corpus of 
the National Corpus of Polish, consisting of about 250 million words, were 
searched for associative responses to the word inwalida given by at least 2 
people from a group of 40 Polish speakers. In the corpus, the co-occurrence 
of the word inwalida was checked with each of the 33 obtained associations, 
using a search tool to identify the contexts (concordances) containing both 
words — inwalida and the association — with an interval of 0 and <5. The results 
of the study indicate that an association test can be a significant complement 
to corpus data analyses: it can provide important elements of semantic prosody 
which are not found in corpus analysis results, it can guide concordance search 
and it can indicate the elements which are the most important for the meaning 
of the examined word. 


Skojarzenia werbalne w Narodowym Korpusie 
Języka Polskiego: przyczynek do badań nad 
werbalnym stereotypem inwalidy 


Streszczenie 


W ostatnich dziesięcioleciach wzrasta rola badań korpusowych w języko- 
znawstwie i naukach pokrewnych. Wyszukiwanie i analiza kolokacji i kon- 
kordancji określonej jednostki leksykalnej, pozwalające na określenie jej 
preferencji semantycznej i prozodii semantycznej, mogą stanowić narzędzie 
badania stereotypów, rozumianych jako nadmiernie uogólnione i uproszczone 
oceniająco-afektywne obrazy fragmentu rzeczywistości nazywanego przez daną 
jednostkę leksykalną. Celem analizy przedstawionej w artykule jest weryfikacja 
zasadności uzupełniania badań opartych na analizie zasobów korpusowych 
danymi uzyskanymi w teście skojarzeń swobodnych. Przeprowadzona analiza 
dotyczy jednostki leksykalnej inwalida, jako nazwy pojęcia podlegającego 
silnej stereotypizacji. W zasobach liczącego około 250 milionów słów podkor- 
pusu zrównoważonego Narodowego Korpusu Języka Polskiego poszukiwano 
reakcji skojarzeniowych na hasło inwalida podanych przez minimum 2 osoby 
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z 40-osobowej grupy użytkowników języka polskiego. Sprawdzono w korpu- 
sie współwystępowanie wyrazu inwalida kolejno z każdym z 33 uzyskanych 
skojarzeń, używając do tego celu narzędzia szukającego kontekstów (kon- 
kordancji) zawierających oba wyrazy — inwalida i skojarzenie — w odstępie 0 
oraz <5. Wykazano, że test skojarzeniowy może w sposób istotny uzupełniać 
analizy korpusowe poprzez: dostarczanie ważnych elementów prozodii seman- 
tycznej, których nie ma w wynikach analiz korpusowych, ukierunkowanie 
wyszukiwania konkordancji oraz wskazywanie elementów najważniejszych 
dla znaczenia badanego wyrazu. 


Keywords: corpus linguistics; National Corpus of Polish; semantic prosody; verbal associa- 
tions; verbal stereotype; invalid 


Słowa kluczowe: językoznawstwo korpusowe; Narodowy Korpus Języka Polskiego; prozodia 
semantyczna; skojarzenia werbalne; stereotyp werbalny; inwalida 
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